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三 维 声 (3D Audio) 音频 技术 方案 与 标准 测试 探讨 


号 要 : 当今 时 代 ， 社 会 经 济 不 断 发 展 ， 科 学 技术 日 新 月 异 。 三 维 声 (3D Audio ) 音频 技术 进入 民众 视野 ， 并 逐步 深入 民众 
常生 活 中 。 三 维 声 (3D Audio ) 这 一 技术 的 应 用 推广 ， 使 声音 影像 具有 三 维 空间 感 和 方位 感 ， 从 而 使 民众 在 虚拟 的 空间 中 
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引言 个 声 道 的 音源 可 以 直接 映射 到 其 指定 的 扬声器 位 置 中 。 


从 工业 时 代 至 今 ， 对 声音 技术 的 探讨 ， 一 直 贯 穿 在 ”这 种 声 道 方式 制作 的 音频 可 以 确保 声音 达到 预期 的 效果 ， 


二 。 社 会 发 展 过 程 中 。 声 音 技术 在 发 展 过 程 中 经 历 了 以 麦克 但 是 为 了 确保 声音 可 以 在 听众 因为 范围 之 内 需要 听众 
已 ” ” 风 、 扬声器 为 代表 的 单 声 道 音频 、 双 声 道 立 体 声音 频 ， 对 位 置 进行 准确 选择 ， 基 于 声 道 方式 制作 的 音频 声音 传 
再 到 之 后 的 5.1 环绕 声 ，7.1 环绕 声音 频 等 ， 声 音 技术 日 ” 播 范 围 小 ， 需 要 在 特定 的 扬声器 布局 里 重新 播放 ， 继 而 
Gd ”站 成 熟 ， 直 至 发 展 到 今天 的 三 维 声 (3D Audio ) 技术 ， 从 ”使 其 声音 效果 更 为 完美 。 
@ 〇 而 使 声音 技术 达到 炉火纯青 的 地 步 。 三 维 声 技术 的 应 用 。 2.2 声 床 + 对 象 的 实现 方式 分 析 
加 D 推广 , 使 广播 电视 业 和 新 闻 业 进一步 发 展 创新 。 三 维 声 (3D Audio ) 是 通过 音箱 阵列 或 耳机 为 听众 
三 1. 三 维 声 的 相关 概述 创造 具有 三 维 空间 感 、 方 位 感 的 声音 影像 ， 使 听众 在 虚 
Cd 1.1 三 维 声 的 含义 拟 的 场景 中 获得 与 人 们 在 真实 世界 中 心理 听觉 方式 相符 、 
©O 所 谓 三 维 声 ， 是 指 借助 音箱 阵列 或 耳机 等 ， 继 而 为 。 与 临场 相似 的 听觉 感受 的 声音 系统 。 三 维 声 技术 在 发 志 
GN 折 众 创造 出 别 样 的 声音 影像 ， 这 些 声音 影像 兼 具 三 维 空 。 过 程 中 也 需要 用 到 声 床 + 对 象 的 实现 方式 ， 声 床 对 基本 
全。 间 感 和 方位 感 ， 从 而 使 听众 在 虚拟 的 场景 中 保持 清醒 的 ”环境 声 起 到 承载 的 作用 ， 属 于 基本 声场 的 音频 信号 。 声 
> 头脑, 对 于 发 声 的 位 置 可 以 做 出 准确 判断 ,而 这 些 声音 ， 道 和 特定 扬声器 位 置 紧密 相连 ， 因 而 ， 要 想 使 声 床 + 对 
则 与 人 们 在 现实 世界 中 所 听 到 的 方式 符号 一 致 ， 从 而 满 。” 象 这 一 方式 实现 ， 需 要 对 元 数据 定义 的 声音 场景 进行 预 
.二 。 足 人 们 对 声音 感知 的 需求 。 先 设 定 。 
1. 2 三 维 声 的 分 类 2. 3 场景 的 实现 方式 分 析 

一 般 来 讲 ， 三 维 声 通常 分 为 三 层 空间 。 第 一 层 空间 现 如 今 ， 民 众 对 音频 技术 的 要 求 越 来 越 高 ， 为 了 满 


i a 足 民众 的 需求 ， 基 于 场景 的 实现 方式 在 三 维 声音 制作 中 
环绕 声音 箱 所 在 的 高 度 。 第 二 层 空 间 则 是 指 与 人 耳 位 置 ”受到 追捧 和 青睐 ， 基 于 场景 的 实现 方式 技术 的 应 用 和 推 
从 30 度 仰角 的 高 度 , 鸟 鸣 声 、 风 吹 声 , 则 表现 得 尤为 明显 ，“ 广 ,声音 在 捕获 方面 和 音频 选择 方面 得 到 很 大 的 突破 。 
是 这 一 层 空 nh 第 三 层 空间 高 度 则 表现 。 在 这 种 发 展 模式 下 ， 声 音 作为 压力 波 进 行 传递 ， 对 于 给 
为 人 耳 正 上 方 所 听 到 的 声音 ， 当 然 ， 这 一 层 高 度 也 被 称 ” 定时 间 的 声音 场景 ， 每 个 点 都 需要 借助 数 个 压力 函数 得 
为 “上 帝 之 音 ” ， 飞 机 飞 过 的 复 鸣 声 ， 暴 风雨 来 临 之 前 。 以 体现 ， 也 就 是 说 ,每 个 点 的 压力 值 在 声音 技术 方面 发 


的 雷鸣 声 等 ， 则 是 这 一 层 空间 高 度 的 典型 例证 。 挥 着 重要 作用 。 倘 若 获 知 该 空间 中 每 个 点 的 压力 值 ， 便 
2. 三 维 声 技术 分 析 可 对 空间 中 的 声音 进行 完美 重 构 。 当 然 ， 为 了 对 每 个 点 
2. 1 声 道 的 实现 方式 分 析 的 压力 值 进 行 捕获 ， 需 要 借助 一 些 方法 对 其 进行 处 理 。 

为 了 对 三 维 声 进 行 全 面 了 解 ， 需 要 对 三 维 声 的 发 声 “其 中 ,包括 基于 球面 谐 波 变换 的 高 阶 精度 系数 ， 进 而 对 
技术 进行 探讨 。 三 维 声 这 一 技术 的 实现 , 依托 三 种 形式 ， 三 维 空间 所 有 点 的 压力 值 进 行 表述 。 空 间 中 每 个 点 的 压 


第 一 种 则 为 基于 声 道 的 方式 ， 第 二 种 属于 声 传 床 + 对 象 ” 力 和 其 邻近 的 点 存在 一 定 的 关系 ， 因 而 ， 可 以 借助 麦克 
的 方式 ， 第 三 种 方式 也 为 基于 场景 ， 从 而 使 三 维 声 这 一 风 阵 列 对 声音 进行 全 方位 收集 ， 应 用 数学 原理 和 公式 对 
技术 得 以 凸显 和 应 用 。 首先 要 探讨 基于 声 道 的 实现 方式 ， 其 进行 计算 ,进而 将 上 述 系数 进行 有 效 推导 。 与 此 同时 ， 
这 种 方式 表现 为 要 对 声 道 配置 进行 预先 设 定 ， 进 而 将 每 ” 为 了 使 基于 场景 的 音频 制作 方式 的 优势 得 以 充分 发 挥 ， 
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需要 对 HOA 系数 进行 准确 获取 ， 提 高 生产 空间 系数 的 编 
码 质量 ， 克 服 音频 制作 方式 的 难点 ， 从 而 使 基于 场景 的 
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在 许多 领域 都 获得 了 广泛 应 用 。 三 维 声 在 我 国 发 展 过 程 
! 需 要 经 过 一 定 的 时 间 考 证 。 三 维 声 专题 组 完成 需求 制 


实现 方式 的 效能 得 以 最 大 发 挥 。 设 计 基 于 VBAP 基本 原 
理 的 三 维 音频 编 解码 框架 ， 以 3 个 声 道 为 一 组 合成 虚拟 
声 源 及 下 混 信 号 ， 编 码 时 增添 时 间 差 参数 ， 在 解码 端 提 
出 基于 线性 方程 组 求解 的 虚拟 声 像 重 分 配方 法 ， 获 得 与 
原始 声 道 配置 一 致 的 重建 信号 。 
2.4 三 维 声 重 放 环境 分 析 

三 维 声 重 放 环 境 在 三 维 声音 频 制作 中 发 挥 着 重要 作 
用 ， 这 种 技术 在 日 本 电台 表现 得 尤为 突出 。 日 本 电视 台 
的 22.2 多 声 道 音频 采用 重 放 环境 这 一 技术 ， 有 22 个 宽频 
扬声器 和 2 个 低频 扬声器 构成 ， 当 然 ， 也 可 以 使 用 较 少 
的 扬声器 对 声音 进行 重 放 。 扬 声 器 使 用 数量 的 多 少 在 很 
大 程度 上 影响 着 最 佳 听 音 的 区 域 范围 ， 也 就 是 说 ， 扬 声 
器 数量 少 , 最 佳 听 音 的 区 域 范围 也 就 越 小 , 两 者 呈正 相关 。 
近年 来 ， 这 种 技术 在 我 国 音频 制作 中 也 得 到 普遍 应 用 和 
推广 ， 电 影院 也 在 采用 这 一 技术 ， 从 而 使 音频 质量 不 断 
提升 。 
2.5 双 耳 泻 染 技术 

虚拟 现实 (Virtual Reality，VR ) 的 兴起 使 三 维 音 频 
技术 得 到 进一步 的 应 用 。VR 中 三 维 音频 的 回放 一 般 采 
用 基于 双 耳 的 方式 ， 目 前 ，VR 中 应 用 较 多 的 三 维 音频 技 
术 有 基于 物理 声场 重建 和 球 谐 分 解 的 Ambisonics 技术 、 
基于 自然 双 耳 录音 ( Binaural recording ) 的 技术 ， 以 及 
基于 头 相 关 传 递 函 数 (Head Related Transfer Function ， 
HRTF ) 重建 的 技术 。 双 耳 泻 染 技术 是 指 三 维 声 的 重 放 可 
以 依托 扬声器 和 耳机 得 以 实现 ， 为 此 ， 为 了 使 这 一 技术 
的 性 能 和 优势 得 以 充分 发 挥 和 体现 ， 需 要 对 事先 制作 好 
的 音源 成 品 编码 文件 进行 解码 ， 从 而 使 普通 立体 声 耳机 
可 以 聆听 三 维 声音 频 。 双 耳 泻 染 技 术 的 诞生 和 应 用 ， 使 
三 维 声 这 一 技术 更 为 成 熟 ， 满 足 了 民众 的 精神 需求 ， 顺 
应 了 时 代 发 展 潮流 ， 从 而 使 这 一 技术 更 为 成 熟 。 
3. 三 维 声 在 我 国 的 标准 
3.1 三维 声 专题 组 的 成 立 

为 了 使 三 维 声 这 一 技术 在 我 国 进一步 推广 和 应 用 ， 
我 国 于 2012 年 3 月 成 立 了 AVS 技 术 应 用 联合 推进 工作 组 ， 
这 一 工作 组 主要 是 由 工业 和 信息 化 部 电子 信息 司 与 国家 
新 闻 出 版 广电 总 局 科技 司 共同 成 立 的 ， 这 一 工作 组 的 成 
立 ， 有 利于 我 国 广 播 电 影 电 视 新 业务 的 进一步 发 展 ， 从 
而 使 我 国 自主 创新 技术 更 为 成 熟 。2016 年 2 月 19 日 , 我 
国 成 立 了 三 维 声 专题 组 ， 三 维 声 专题 组 的 牵头 单位 是 中 
央 电 视 台 。 这 一 专题 组 的 成 立 ， 使 广播 电视 领域 的 三 维 
声 节目 制作 、 传 输 分 发 和 重 放 技 术 工作 进一步 开展 。 
3. 2 三 维 声 在 我 国 的 发 展 

近年 来 立体声、 多 声 道 音 频 编码 技术 发 展 迅 速 ， 


定 工作 的 时 间 是 2016 年 4 月 15 日， 之 后 于 4 月 16 日 三 
维 声 技术 提案 征集 得 以 启动 。 在 此 之 后 ， 三 维 声 专题 组 
召开 第 一 次 工作 组 会 议 。 各 提案 方 提交 三 维 声 的 最 终 提 
案 时 间 为 2017 年 1 月 19 日 ，2017 年 10 月 完成 标准 的 测 
试验 证 工作 。 当 前 ， 三 维 声 专题 组 正在 进行 测试 总 结 ， 
并 开展 标准 的 撰写 工作 。 
3. 3 三 维 声 在 我 国 广播 电视 行业 标准 的 探讨 

从 目前 发 展 情况 来 看 ， 我 国 的 三 维 声 广播 电视 行业 
标准 现 阶段 基本 上 采用 基于 声 床 + 对 象 的 实现 方式 ， 也 
就 是 说 , 需要 在 视 音频 压缩 编码 端 和 接收 终端 进行 测试 。 
因而 ,需要 对 支持 的 对 象 进 行 明 确 ， 具 体 表现 为 三 维 生 
产 中 的 坐标 定位 、 音 量 大 小 、 对 象 声 音 有 无 等 。 同 时 ， 
也 需要 对 下 方 控制 、 声 道 描述 、 节 目 相 关 信 息 描 述 等 工 
作 进 行 有 效 开 展 。 此 外 ， 在 后 期 制作 中 也 需要 对 支持 对 
象 进行 明确 ,在 后 期 制作 环境 中 ,至 少 需 要 支持 64 个 对 象 ， 
在 直播 环境 中 最 少 需要 支持 四 个 对 象 ， 从 而 营造 良好 的 
环境 氛围 ， 进 而 满足 听众 更 高 层次 的 声音 享受 。 
结语 

三 维 声 的 声音 传播 方式 使 声音 效果 发 生 极 大 变化 ， 
由 最 初 的 静态 传播 转变 为 动态 传输 。 同 时 ， 三 维 生 可 以 营 
造 良好 的 声音 环境 ， 从 而 满足 听众 对 声音 的 高 层次 需求 。 
三 维 声 技 术 的 应 用 推广 在 很 大 程度 上 促进 了 广播 电视 业 的 
发 展 ， 从 而 使 科技 更 好 地 为 人 类 社会 发 展 服务 。 咽 
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